超参数优化(HPO)和神经体系结构搜索(NAS)是获得一流的机器学习模型的选择,但实际上,它们的运行成本很高。当在大型数据集上培训模型时,即使采用了有效的多志愿方法,对从业者进行HPO或NAS的调整迅速昂贵。我们提出了一种方法,以应对在具有有限计算资源的大型数据集上培训的调整机器学习模型的挑战。我们的方法名为Pasha,能够根据需要动态分配最大资源为调整过程。实验比较表明,Pasha识别出良好的超参数配置和体系结构,同时消耗的计算资源明显少于ASHA等解决方案。
translated by 谷歌翻译
最先进的文本分类器的大尺寸和复杂的决策机制使人类难以理解他们的预测,导致用户缺乏信任。这些问题导致采用Shail和集成梯度等方法来解释分类决策,通过为输入令牌分配重要性分数。然而,使用不同的随机化测试之前的工作表明,通过这些方法产生的解释可能不具有稳健性。例如,对测试集的相同预测的模型可能仍然导致不同的特征重要性排名。为了解决基于令牌的可解释性缺乏稳健性,我们探讨了句子等更高语义层面的解释。我们使用计算指标和人类主题研究来比较基于令牌的句子的解释的质量。我们的实验表明,更高级别的特征属性提供了几个优点:1)由于随机化测试测量,2)当使用近似的基于方法等诸如Shav等的方法来说,它们更加强大,并且3)它们更容易理解在语言相干性在更高的粒度水平上存在的情况下的人类。基于这些调查结果,我们表明,令牌的可解释性,同时是鉴于ML模型的输入接口的方便的首选,不是所有情况中最有效的选择。
translated by 谷歌翻译
我们根据梯度匹配的思想设计了一种Coreset选择方法:Coreset引起的梯度应该尽可能地匹配原始训练数据集的那些。我们在持续学习的背景下评估该方法,可用于策划排练内存。我们的方法在一系列内存大小上执行强大的竞争对手,如水库采样。
translated by 谷歌翻译
Depth cues are known to be useful for visual perception. However, direct measurement of depth is often impracticable. Fortunately, though, modern learning-based methods offer promising depth maps by inference in the wild. In this work, we adapt such depth inference models for object segmentation using the objects' ``pop-out'' prior in 3D. The ``pop-out'' is a simple composition prior that assumes objects reside on the background surface. Such compositional prior allows us to reason about objects in the 3D space. More specifically, we adapt the inferred depth maps such that objects can be localized using only 3D information. Such separation, however, requires knowledge about contact surface which we learn using the weak supervision of the segmentation mask. Our intermediate representation of contact surface, and thereby reasoning about objects purely in 3D, allows us to better transfer the depth knowledge into semantics. The proposed adaptation method uses only the depth model without needing the source data used for training, making the learning process efficient and practical. Our experiments on eight datasets of two challenging tasks, namely camouflaged object detection and salient object detection, consistently demonstrate the benefit of our method in terms of both performance and generalizability.
translated by 谷歌翻译
Deconvolution is a widely used strategy to mitigate the blurring and noisy degradation of hyperspectral images~(HSI) generated by the acquisition devices. This issue is usually addressed by solving an ill-posed inverse problem. While investigating proper image priors can enhance the deconvolution performance, it is not trivial to handcraft a powerful regularizer and to set the regularization parameters. To address these issues, in this paper we introduce a tuning-free Plug-and-Play (PnP) algorithm for HSI deconvolution. Specifically, we use the alternating direction method of multipliers (ADMM) to decompose the optimization problem into two iterative sub-problems. A flexible blind 3D denoising network (B3DDN) is designed to learn deep priors and to solve the denoising sub-problem with different noise levels. A measure of 3D residual whiteness is then investigated to adjust the penalty parameters when solving the quadratic sub-problems, as well as a stopping criterion. Experimental results on both simulated and real-world data with ground-truth demonstrate the superiority of the proposed method.
translated by 谷歌翻译
我们提出了一种新型混合电缆的机器人,并使用操纵器和摄像头,用于在垂直水培农场中进行高临界性,中等通量的植物监测,并以示例应用显示出无损的植物质量估计。具有高时空和空间分辨率的植物监测对农民和研究人员都很重要,以检测异常和开发植物生长的预测模型。高质量,现成的结构(SFM)和摄影测量包的可用性使一个充满活力的机器人社区能够将计算机视觉应用于非破坏性植物监测。尽管现有的方法倾向于集中于高通量(例如卫星,无人机(UAV),车辆安装,输送带图像)或对闭塞的高临界/鲁棒性(例如,转弯台式扫描仪或机器人组),,机器人臂),,,,机器人组合我们提出了一个中间地面,该地面可以通过中等通知,高度自动化的机器人获得高精度。我们的设计配对了电缆驱动的平行机器人(CDPR)的工作空间可伸缩性与4度(DOF)机器人臂的敏捷性,以自主对许多植物进行自主对许多植物的想象。我们描述了我们的机器人设计,并通过从64个观点中收集54种植物的每日照片来实验证明它。我们表明,我们的方法可以产生科学有用的测量结果,在初始校准后完全自主运行,并产生更好的重建和植物特性估计值(例如无用的方法)。作为应用程序,我们表明,我们的系统可以成功估计植物质量,平均绝对误差(MAE)为0.586g,并且当用于对质量与年龄之间的关系进行假设测试时,会产生与地面真相相当的P值数据(分别为p = 0.0020和p = 0.0016)。
translated by 谷歌翻译
移动对象检测(MOD)是成功实现安全自动驾驶的关键视觉任务。尽管深度学习方法的结果合理,但大多数现有方法仅基于框架,并且在与动态的交通参与者打交道时可能无法达到合理的性能。传感器技术的最新进展,尤其是事件摄像头,可以自然地补充传统的摄像头方法,以更好地模型移动对象。但是,基于事件的作品通常会采用预定义的时间窗口进行事件表示,并简单地将其集成以估算事件的图像强度,从而忽略了可用异步事件的许多丰富时间信息。因此,从新的角度来看,我们提出了一种新型的RGB事件融合网络Renet,该网络共同利用这两种互补方式,以在挑战性的情况下实现更强大的MOD,以实现自主驾驶。具体而言,我们首先设计一个时间多尺度聚合模块,以完全利用RGB曝光时间和较大间隔的事件框架。然后,我们引入一个双向融合模块,以认真校准和融合多模式特征。为了评估网络的性能,我们仔细选择并从常用的DSEC数据集中选择一个子模型数据集。广泛的实验表明,我们提出的方法的性能明显优于最新的RGB事实融合替代方案。
translated by 谷歌翻译
我们提供了一种差异化私有算法,用于同时生成多个任务的合成数据:边际查询和多任务机器学习(ML)。我们算法中的一个关键创新是能够直接处理数值特征的能力,与许多相关的先验方法相反,这些方法需要首先通过{binning策略}将数值特征转换为{高基数}分类特征。为了提高准确性,需要较高的分子粒度,但这会对可伸缩性产生负面影响。消除对套在一起的需求使我们能够产生合成数据,以保留大量统计查询,例如数值特征的边际和条件线性阈值查询。保留后者意味着在特定半空间上方的每个类标记的点的比例在实际数据和合成数据中都大致相同。这是在多任务设置中训练线性分类器所需的属性。我们的算法还使我们能够为混合边缘查询提供高质量的合成数据,这些数据结合了分类和数值特征。我们的方法始终比最佳可比技术快2-5倍,并在边缘查询和混合型数据集的线性预测任务方面提供了显着的准确性改进。
translated by 谷歌翻译
由多种因素引起的组织学图像的染色变化不仅是病理学家的视觉诊断,而且是细胞分割算法的挑战。为了消除颜色变化,已经提出了许多染色归一化方法。但是,大多数是为苏木精和曙红染色图像而设计的,并且在免疫组织化学染色图像上表现不佳。当前的细胞分割方法系统地将染色归一化作为预处理步骤,但是尚未定量研究颜色变化带来的影响。在本文中,我们制作了五组具有不同颜色的Neun染色图像。我们应用了一种深度学习的图像录制方法来在组织学图像组之间执行色彩转移。最后,我们改变了分割集的颜色,并量化了颜色变化对细胞分割的影响。结果证明了在后续分析之前必须进行颜色归一化的必要性。
translated by 谷歌翻译
姿势估计通常被解决为垃圾箱分类问题或回归问题。在这两种情况下,这个想法都是直接预测对象的姿势。这是一项非平凡的任务,因为不同姿势之间的相似姿势和相似性的外观变化。取而代之的是,我们遵循关键思想,即比较两个姿势要比估计它们更容易。到此为止,已经采用了渲染和能力方法,但是它们往往是不稳定的,计算昂贵的,并且对于实时应用程序而言却很慢。我们建议通过使用动态边缘和连续的姿势标签空间学习对齐度损失来进行类别级别的姿势估计。为了高效的推断,我们使用一个简单的实时图像检索方案,其中包含投影到嵌入空间的参考渲染集。为了实现对现实世界条件的鲁棒性,我们采用合成阻塞,边界盒扰动和外观增强。我们的方法在Pascal3D和OckludedPascal3D上实现了最先进的性能,以及Kitti3d的高质量结果。
translated by 谷歌翻译